数据驱动的湍流建模正在经历数据科学算法和硬件开发后的兴趣激增。我们讨论了一种使用可区分物理范式的方法,该方法将已知的物理学与机器学习结合起来,以开发汉堡湍流的闭合模型。我们将1D汉堡系统视为一种原型测试问题,用于建模以对流为主的湍流问题中未解决的术语。我们训练一系列模型,这些模型在后验损失函数上结合了不同程度的物理假设,以测试模型在一系列系统参数(包括粘度,时间和网格分辨率)上的疗效。我们发现,以部分微分方程形式的归纳偏差的约束模型包含已知物理或现有闭合方法会产生高度数据效率,准确和可推广的模型,并且表现优于最先进的基准。以物理信息形式添加结构还为模型带来了一定程度的解释性,可能为封闭建模的未来提供了垫脚石。
translated by 谷歌翻译
Consider two brands that want to jointly test alternate web experiences for their customers with an A/B test. Such collaborative tests are today enabled using \textit{third-party cookies}, where each brand has information on the identity of visitors to another website. With the imminent elimination of third-party cookies, such A/B tests will become untenable. We propose a two-stage experimental design, where the two brands only need to agree on high-level aggregate parameters of the experiment to test the alternate experiences. Our design respects the privacy of customers. We propose an estimater of the Average Treatment Effect (ATE), show that it is unbiased and theoretically compute its variance. Our demonstration describes how a marketer for a brand can design such an experiment and analyze the results. On real and simulated data, we show that the approach provides valid estimate of the ATE with low variance and is robust to the proportion of visitors overlapping across the brands.
translated by 谷歌翻译
在整个计算科学中,越来越需要利用原始计算马力的持续改进,通过对蛮力的尺度锻炼的尺度增加,以增加网状元素数量的增加。例如,如果不考虑分子水平的相互作用,就不可能对纳米多孔介质的转运进行定量预测,即从紧密的页岩地层提取至关重要的碳氢化合物。同样,惯性限制融合模拟依赖于数值扩散来模拟分子效应,例如非本地转运和混合,而无需真正考虑分子相互作用。考虑到这两个不同的应用程序,我们开发了一种新颖的功能,该功能使用主动学习方法来优化局部细尺度模拟的使用来告知粗尺度流体动力学。我们的方法解决了三个挑战:预测连续性粗尺度轨迹,以推测执行新的精细分子动力学计算,动态地更新细度计算中的粗尺度,并量化神经网络模型中的不确定性。
translated by 谷歌翻译
在过去的十年中,由于雷达目的的现场特异性,高保真射频(RF)建模和仿真工具的催化,在过去的十年中,经典方法的数据驱动公式迅速增长。尽管有这种激增,但有限的焦点已针对这些经典方法的理论基础。在这方面,作为我们正在进行的数据驱动的雷达时空自适应处理方法(Stap)的一部分,我们在雷达目标定位的背景下分析了精选子空间分离方法的渐近性能保证,并通过拟议目标位置估计的深度学习框架。在我们的方法中,我们通过使用RFView(由ISL Inc.开发的一个特定于站点的RF建模和模拟工具)将可变强度的目标随机放置在预定的约束区域中。在范围内,方位角和归一化自适应匹配过滤器(NAMF)测试统计量以及广义Sidelobe canceller(GSC)的输出功率的高度。使用我们的深度学习框架,我们从这些热图张量估算目标位置,以证明我们数据驱动方法在匹配和不匹配的设置中提供的可行性和显着改进。
translated by 谷歌翻译
在线学习系统具有成绩单,书籍和问题形式的多个数据存储库。为了易于访问,此类系统会根据层次性质(主题 - 主题)的明确分类法组织内容。将输入分类为层次标签的任务通常被视为平坦的多类分类问题。这种方法忽略了输入中的术语与层次标签中的令牌之间的语义相关性。当它们仅将叶片节点视为标签时,替代方法也患有类不平衡。为了解决这些问题,我们将任务制定为一个密集的检索问题,以检索每个内容的适当层次标签。在本文中,我们处理问题。我们将层次标签建模为其令牌的组成,并使用有效的交叉注意机制将信息与内容术语表示融合。我们还提出了一种自适应内部的硬采样方法,随着培训的进行,该方法可以更好地取消负面影响。我们证明了所提出的方法\ textit {tagrec ++}在问题数据集上的现有最新方法均超过了receal@k所测量的现有最新方法。此外,我们演示了\ textit {tagrec ++}的零射击功能以及适应标签更改的能力。
translated by 谷歌翻译
近年来,高吞吐量筛选的进步,对更复杂的化学设计空间的可访问性以及准确的分子建模框架的发展,近年来快速发现了新的反应和分子。因此,对不断增长的化学文献进行的整体研究是必需的,该研究重点是理解最近的趋势并将其推断到可能的未来轨迹中。为此,已经报道了几项基于网络理论的研究,该研究使用了化学反应的定向图表示。在这里,我们根据代表化学反应作为超图表的研究进行了一项研究,其中超蛋白代表化学反应,节点代表参与分子。我们使用标准反应数据集来构建超网络,并报告其统计数据,例如学位分布,平均路径长度,分类性或程度相关性,pagerank中心性和基于图的集群(或社区)。我们还计算了每个统计量的反应的等效的有向图表示,以绘制相似之处并突出两者之间的差异。为了证明超图反应表示的AI适用性,我们生成致密的超透明嵌入,并将其用于反应分类问题。我们得出的结论是,超网络表示是灵活的,可以保留反应环境,并发现了隐藏的见解,这些洞察力在传统的化学反应的传统图形表示中却不明显。
translated by 谷歌翻译
作为内容编辑成熟的工具,以及基于人工智能(AI)综合媒体增长的算法,在线媒体上的操纵内容的存在正在增加。这种现象导致错误信息的传播,从而更需要区分“真实”和“操纵”内容。为此,我们介绍了Videosham,该数据集由826个视频(413个真实和413个操纵)组成。许多现有的DeepFake数据集专注于两种类型的面部操作 - 与另一个受试者的面部交换或更改现有面部。另一方面,Videosham包含更多样化的,上下文丰富的和以人为本的高分辨率视频,使用6种不同的空间和时间攻击组合来操纵。我们的分析表明,最新的操纵检测算法仅适用于一些特定的攻击,并且在Videosham上不能很好地扩展。我们在亚马逊机械土耳其人上进行了一项用户研究,其中1200名参与者可以区分Videosham中的真实视频和操纵视频。最后,我们更深入地研究了人类和sota-Algorithms表演的优势和劣势,以识别需要用更好的AI算法填补的差距。
translated by 谷歌翻译
我们提出了一种方法,可以根据他们观看过的先前视频中标记的其首选亮点剪辑来检测给定目标视频中用户的个性重点。我们的方法明确利用对象和人类活动的预训练功能来利用首选剪辑和目标视频的内容。我们设计了一种多头注意机制,可以根据其基于对象和人类活性的内容适应优选的剪辑,并将这些权重融合为每个用户的单个特征表示。我们计算这些每个用户功能表示形式与从所需目标视频计算的每个框架功能之间的相似性,以估算目标视频中用户特定的高光剪辑。我们在包含单个用户带注释的重点的大规模检测数据集上测试我们的方法。与当前的基线相比,我们观察到在检测到的高光的平均平均精度中的绝对改善2-4%。我们还对与每个用户以及基于对象和人类活动的功能表示相关的首选突出显示剪辑的数量进行了广泛的消融实验,以验证我们的方法确实是基于内容的和特定于用户的。
translated by 谷歌翻译
我们提出Simprov-可扩展的图像出处框架,将查询图像匹配回到可信的原始数据库,并在查询上确定可能的操作。 Simprov由三个阶段组成:检索Top-K最相似图像的可扩展搜索阶段;一个重新排列和近乎解复的检测阶段,用于识别候选人之间的原件;最后,在查询中定位区域的操纵检测和可视化阶段可能被操纵与原始区域不同。 Simprov对在线再分配过程中通常发生的良性图像转换非常强大,例如由于噪声和重新压缩降解而引起的工件,以及由于图像填充,翘曲,尺寸和形状的变化而引起的过度转换。通过对比较器体系结构中可区分的翘曲模块的端到端训练,可以实现对实地转换的鲁棒性。我们证明了对1亿张图像的数据集的有效检索和操纵检测。
translated by 谷歌翻译
避免地下储层中的过度压力对于诸如二氧化碳和废水注射等应用至关重要。通过控制注入/提取来管理压力,由于地下的复杂异质性。异质性通常需要高保真物理模型来对Co $ _2 $命运做出预测。此外,精确表征异质性的情况会充满参数不确定性。考虑到异质性和不确定性,这都使这是对当前储层模拟器的计算密集型问题。为了解决这个问题,我们使用全物理模型和机器学习的可区分编程来确定防止关键储层位置过度压力的流体提取率。我们使用DPFEHM框架,该框架具有基于标准的两点通量有限量离散化的值得信赖的物理学,并且像机器学习模型一样自动差异化。我们的物理知识的机器学习框架使用卷积神经网络根据渗透率领域学习适当的提取率。我们还执行超参数搜索以提高模型的准确性。执行培训和测试方案,以评估使用物理知识的机器学习来管理储层压力的可行性。我们构建并测试了一个足够精确的模拟器,该模拟器的速度比基于物理的模拟器快400000倍,从而允许接近实时分析和鲁棒的不确定性量化。
translated by 谷歌翻译